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. Objetivos 

Comprender los fundamentos logico-matematicos de la inferencia estadfstica; 

Saber plantear, resolver e interpretar problemas de intervalos de confianza; 

Comprender las distintas fases de un contraste de hipotesis; 

Saber plantear, resolver e interpretar problemas de contraste de hipotesis; 

Analizar los errores que pueden cometerse en un contraste de hipotesis; 

Enjuiciar la correcta aplicacion de las pruebas estadfsticas en situaciones de investigacion concretas; 

Saber interpretar el resultado del valor p a la hora de tomar decisiones en los contrastes de hipotesis. 



2. Inferencia estadistica 

La inferencia estadfstica es aquella rama de la estadistica mediante la cual se trata de sacar conclusiones 
de una poblacion en estudio, a partir de la informacion que proporciona una muestra representativa de la 
misma. Tambien es denominada "estadistica inductiva" o "inferencia inductiva" ya que es un procedimiento 
para generar nuevo conocimiento cientffico. 

La muestra se obtiene por observacion o experimentacion. La necesidad de obtener un subconjunto 
reducido de la poblacion es obvia si se tiene en cuenta los costes economicos de la experimentacion o el 
hecho de que muchos de los metodos de medida son destructivos. 

Toda inferencia inductiva exacta es imposible ya que se dispone de informacion parcial, sin embargo es 
posible realizar inferencias inseguras y medir el grado de inseguridad si el experimento se ha realizado de 
acuerdo con determinados principios. Uno de los propositus de la inferencia estadfstica es el de conseguir 
tecnicas para hacer inferencias inductivas y medir el grado de incertidumbre de tales inferencias. La medida 
de la incertidumbre se realiza en terminos de probabilidad. 

Muestra 

\Xj i X2 t • • • t X n j 



inferencia 



\ 




POBLACION 

(DISTRIBUTION DE 

PROBABILIDAD) 

Figura 1. Esquema de inferencia estadistica. 

De acuerdo con el conocimiento sobre la distribucion en la poblacion, la inferencia estadistica puede 
dividirse en: 

• Inferencia parametrica: se conoce la forma de la distribucion (normal, binomial, Poisson, etc..) pero se 
desconocen sus parametros. Se realizan inferencias sobre los parametros desconocidos de la 
distribucion conocida; 

• Inferencia no parametrica: forma y parametros desconocidos. Se realizan inferencias sobre 
caracteristicas que no tienen porque ser parametros de una distribucion conocida (mediana, 
estadisticos de orden). 

De acuerdo con la forma en que se estudian los parametros o caracteristicas desconocidas, la inferencia 
puede dividirse en: 

• Estimacion: se intenta dar estimaciones de los parametros desconocidos sin hacer hipotesis previas 
sobre posibles valores de los mismos: 

• Estimacion puntual: un unico valor para cada parametro; 

• Estimacion por intervalos: intervalo de valores probables para el parametro. 

• Contraste de hipotesis: se realizan hipotesis sobre los parametros desconocidos y se desarrolla un 
procedimiento para comprobar la verosimilitud de la hipotesis planteada. 

3. Intervalos de confianza 



En los metodos de estimacion puntual se utiliza una funcion de los valores de la muestra (estadistico) para 
dar la estimacion del parametro en estudio. Si en vez de esto, se utilizan dos funciones y se da el valor de 
dicho parametro a partir del intervalo que tiene por extremos los valores de dichas funciones para una 
muestra, se dice que se esta dando una estimacion por intervalos del parametro, o un intervalo de 
confianza. 



En la construccion de estos intervalos, hay dos elementos fundamentales. La amplitud del intervalo que 
dara la precision de la estimacion, y que por lo tanto debera ser la menor posible, y la probabilidad de que el 
intervalo contenga al verdadero valor del parametro a estimar, que se llama nivel de confianza o coeficiente 
de confianza, y que debera ser lo mayor posible. Esta claro que se puede ganar en precision a base de 
perder confianza en la estimacion. 

Para centrar ideas, vease el caso en el que se selecciona una muestra aleatoria simple de una poblacion 

descrita por la funcion /(x;6) dependiente del parametro 6 que pretendemos estimar. El problema se 

plantea como sigue: se fija un nivel de confianza, que se denota por 1 — a , en donde 0<a<l , y se trata de 
determinar dos funciones 

U[ I Xj ,X 2 j. . .,X B I 

O 2 I Xj ,X 2 , • . • ,X n J 

Pr(e i (x 1 ,x 2 ,...,x n )<0<0 2 (x 1 ,x 2 ,...,x„)j = 1-a 



de forma que: 



Al 



intervalo [Q l (x l ,x 2 ,...,x n ) , 6 2 (x 15 x 2 ,...,x n ) 



se le llama intervalo de confianza de 6 al nivel de 



confianza del (l-a)xl00% . Es muy importante observar que seria un error afirmar que la probabilidad 

indicada anteriormente, es la probabilidad de que 6 este entre los numeros reales Q l lx l ,x 2 ,...,x H ) y 

6 2 (x 1 ,x 2 ,...,x n ) puesto que 6 no es una variable aleatoria sino un parametro que tendra un valor 

concreto, aunque sea desconocido. Las variables aleatorias son Q l (x l ,x 2 ,...,x) y B 2 (x l ,x 2 ,...,x n ) 
al variar la muestra, luego la probabilidad anterior debe ser considerada como la probabilidad de que el 
intervalo aleatorio 6 1 (x 1 ,x 2 ,...,x n )a Q 2 (x l ,x 2 ,...,x) contenga el verdadero valor de . Dicho en 
terminos de frecuencias esto significa que de cada 100 muestras aleatorias que se tomen, cabe esperar que 
el (l-a)xl00% de ellas contenga al verdadero valor de 6 entre Q 1 (x 1 ,x 2 ,...,x n ) y 

O j I Xj ,X 2 ,. . • ,X n I . 

El esquema general para la estimacion de un intervalo de confianza es: 

estimador ± coeficiente de confiabilidad x error estdndard 

El coeficiente de confiabilidad (z o t) indica entre mas/menos cuantos errores estandar del estimador esta 
1-a del area de la distribucion muestral del estadfstico. 

La probabilidad de que los valores obtenidos a traves del estimador por medio de un intervalo contenga el 
verdadero valor del parametro que se pretende estimar de la poblacion, es 1-a . La probabilidad de estimar 

1-a de la poblacion se llama tambien "coeficiente de confianza" o "probabilidad de acertar". Los 
coeficientes de confianza mas utilizados son: 0,90, 0,95 y 0,99. 

La probabilidad a ("probabilidad de equivocarse") se divide en dos areas en los extremos I a /r. J . 




Valores del coeficiente de confiabilidad si «>30(z) 



Para 



Para 



Para 



1-a = 99% 



1-a = 95% 



1-a = 90% 



a = 1% = 0,01 
z % = +2,58 
a = 5% = 0,05 
z % = ±1,96 
a = 10% = 0,10 
z a/ = ±1,64 



A la mitad de la amplitud del intervalo de confianza se le llama precision del estimador. 
En todo intervalo de confianza hay un aspecto positivo y un aspecto negativo: 

• El positivo, se ha usado una tecnica que acierta en una alta proporcion de casos; 

• El negativo, se desconoce si en el caso concreto se ha acertado. 

4.1. Intervalos de confianza para la media 

Se supone que jx l5 x 2 ,...,x n } es una muestra aleatoria simple y que xes la media muestral. 

4.1.1.Poblaci6n normal de varianza conocida. 

En estas condiciones, la variable aleatoria x media muestral se distribuye segun una distribucion 

.2 



N\\i,® / , suponiendo que la poblacion es jV(u,,g 2 j con a conocida. Esta propiedad permite asegurar 



x-u. 



que la variable tipificada — -, — sigue una distribucion jV(0,1) , y por lo tanto, fijado el nivel de confianza 
1-a , obtener el valor z o/ tal que: 



Operando, resulta: 



Pr 



x-u, 

Yr 



<z„ 



= 1-a 



1-a 



Pr 



■z„, < — j— < z„ 



= Pr 



= Pr 



J 



a s - s a 
n y/n j 



■X-Z a/ —j=< -u,< -x + z a/ -^ 



= Pr 



X —Z„, —;= < IX < X + Z a/ —^ 

A 4n A yfn 



con lo que las funciones 6j y 6 2 buscadas, en este caso, seran 



6, = x + z„ 



X Za/ 



O 



n 

a 

sin 



y el intervalo de confianza para la media poblacional al nivel de confianza del (1 - a ) 100% es: 

_ a _ a 

X Zy ~j= , X + Z r y ~j= 

\ln yjn 

Se puede ganar en precision de dos formas, bien perdiendo confianza lo que, en general, no interesa, o 
bien aumentando el tamano n de la muestra seleccionada. 

4.1.2.Poblaci6n normal de varianza desconocida. 

Sea ahora una poblacion jV(u,,ct 2 ) con a desconocida. Es evidente que en este caso se han de utilizar 

estimadores que no dependan del valor a . De aquf la importancia de las distribuciones que no dependen 

x-u, 
de este valor, como es el caso de la t de Student. En estas condiciones, la variable -, , es una t- 



V^T 



Student con n— 1 grados de libertad, en donde s es la desviacion tfpica muestral. Esta propiedad permite, 
fijado el nivel de confianza 1 — a , obtener el valor t a/ tal que: 



Pr 



x-u. 


s /l — 



<t„ 



= 1-a 



Operando de igual forma que en el apartado anterior resulta: 



Pr 



x - t„ 



y el intervalo de confianza en este caso es: 



< u, < x + L 



V^T 



l-a 



X t a y 



V^T 



, x + L 



2 V^T 



4.1.3 Intervalo de confianza para la media geometrica 

El intervalo de confianza para la media geometrica viene dado por la expresion: 



*lo 8 ±z a/ aVl °S 



Que es consecuencia de: 

• Transformar los valores de la variable X en log(X) ; 

• Hallar la media x x de los log(X); 

• Hallar el error estandar es x de la media de los log(X) . 

4.2. Intervalo de confianza para medianas y otros cuantiles 

El intervalo de confianza para los cuantiles en general es: 



Para un percentil 80, ^ = 0,8 . 
Para la mediana 



(n + \)q ± z a Jnq(\-q) 



+ z , 



teniendo en cuenta que los valores corresponden al numero de orden fijado por dicho intervalo y que ocupa 
cada dato de la variable cuando se ordenan de menor a mayor. 



4.3. Intervalo de confianza para la proporcion 

El intervalo de confianza para una proporcion "/ es: 



p ± z 



\p(\-p) 



4.4. Intervalos de confianza para la varianza 



fl s 
Suponiendo que la poblacion es normal de media u, y desviacion tfpica a , la variable aleatoria — — sigue 

a 

una distribucion % 2 con n — \ grados de libertad. Esta propiedad, permite obtener dos valores j£ a/ y ytf. a/ 
tales que: 



Pr 



Xl_<V 



< 



n s 



< 



a 



X«/ 



luego: 



Pr 



f ^ 



V 



2 — 2 

n s x« 



1-a 



= 1-a 



W 



con lo que resulta: 



Pr 



^2 2^ 

n s 2 ^ n s 

— ~ — < a < — ; — 



v 



X" 



1-a 



'i-%; 



por lo que el intervalo de confianza para la varianza poblacional, al nivel de confianza del (1-a) 100%, 
viene dado por: 



o de manera analoga: 



n s 

X «y 



n-\ s' 

X a/ 



n s 
Xi_«/ 



n—\ s' 



[1] 



Observese que, a diferencia de la estimacion de la media por intervalos, el intervalo anterior no es unico, es 
decir, que existen infinitos pares de valores %„, y Xi_y c l ue verifican [1]. De entre estos pares de valores 



deberfan elegirse aquellos que den el intervalo de menor amplitud; sin embargo, al ser muy complicados los 
calculos, se utilizan en la practica los valores de % u/ y Xi_y indicados en la figura: 




Figura 3. 



4.5. Intervalo de confianza para la razon de varianzas 



El intervalo de confianza para la razon 



de varianzas es: 



F 



(1,-1.11,-1, % 



F 



(1,-1.71, -1,1- V 



4.6. Intervalo de confianza para el coeficiente de variacion 

El intervalo de confianza para el coeficiente de variacion es: 



CV 



cv 

donde j = xL ; 

v son los grados de libertad. 

4. 7. Intervalo de confianza para la diferencia de medias en poblaciones normales con 
varianza conocida 

Sea jx, ,x 2 ,...,% \ un muestreo aleatorio simple de N\\i l ,a^Jy \y l ,y 2 , •■•,}>„] uno de N([i 2 ,a 2 2 j. 
Ambas muestras son independientes. Supongase que u,[ y u, 2 son desconocidos y que a, y a 2 son 
conocidas. Se desea obtener un intervalo de confianza para (u^ -u, 2 j de nivel 1 — a . 
Se sabe que: 



f 



x -y ~ N 



Existe un z a/ que verifica: 



Hi-Jij 



+ 



{x-y)-[\i x -\i 2 ) 



N{0,1) 



+ 



Pr 



(x-j)-(^ 1 -^ 2 ) 
•z n/ < , < z, 



, 2 _2 

ii, n 2 



= 1-a 



-z„, < , =^> (Hi-H 2 j ^ (x-j) + z ( 



, 2 _2 



+ 



Despejando: 



Entonces: 

f 



Pr 



(x-j)-((^ 1 -(^ 2 ) 



< z, 



i^ 2 2 

n 1 n 2 



(p-i-p-i) * {x-y)-z, 



■Z„/ < j < z, 



i«. 2 ^ 2 

«j ft 2 



= 1-a O Pr 



(x-j)- 



Luego el intervalo de confianza de nivel 1-a es: 

(x-y) ± z, 



+ 



, 2 2 

,CJ 1 + ^1 

n t n 2 



, 2 _2 

a, a 



— + — < U l -[i 2 ) 



4.8. Intervalo de confianza para la diferencia de medias de dos distribuciones normales, 
varianzas desconocidas pero iguales 

Si Xj , x 2 , s 2 x y s\ son las medias y las varianzas de dos muestras aleatorias de tamano n 1 y n 2 , 
respectivamente, tomadas de dos poblaciones normales e independientes con varianzas desconocidas pero 
iguales, el intervalo de confianza del (l-a)xl00% para la diferencia entre medias (|u 1 -|u, 2 ) es: 






\jn l n 2 



donde: s, 



s\\n l -lj + s\\n 2 -lj 



n \ +n i ~2 



es el estimador combinado de la desviacion tfpica comun de la 



poblacion con n 1 +n 2 -2 grados de libertad. 



4.9. Intervalo de confianza para la diferencia de medias de dos distribuciones normales 
con varianzas desconocidas 

El intervalo de confianza para la diferencia de medias ]i { — \i 2 de dos distribuciones normales, varianzas 
desconocidas pero diferentes es: 



2 2 

s, s. 



(*i ~ x i) ± t \—+ — 



f „2 „2 A 

+ 



donde: v 



v 



n l n 



2 J 



, son los grados de libertad 

f 2\ 2 f 2 \ 2 



K n XJ 



+ 



K n 2j 



n 1 -l n 2 -\ 

4.10. Intervalo de confianza para la diferencia de medias con datos apareados 

Sean 

X -» N{v x ,cs x ) 

Y -+ N(n Y ,o y ) 
De ambas se extraen dos muestras aleatorias: 

|X[ ,x 2 ,...,x n j 

Se define 

D = X -Y 
Que tiene la muestra asociada: 

{d l =x 1 -y l , d 2 =x 2 -y 2 ,... ,d„=x„-y n ] 
El intervalo de confianza es: 

4.11. Intervalo de confianza de la diferencia de proporciones 

Recuerdese que para muestras de tamano grande, el estimador p x —p 1 es aproximadamente normal con 
media p x -p 2 yvarianza 

Pi( l ~Pi) Pi{ l -Pi) 



El intervalo de confianza es, entonces: 



Pi~P: 



±z l A(i-A) | £2(1-^2) 

V «i n 2 



4.12. Intervalo de confianza para el parametro A de una distribution de Poisson 

El intervalo de confianza para el parametro X de una distribution de Poisson es: 



donde: n 



f z\, ^ 



X + 



In 



X±z 



f 



r 



max 

v v 



(z* 



J , 



X 




,^JX - z, 



f z\ 



+ 4X 



2Jn 



>) 



X + z, 



V10<X<20 



VX>20 



l4n 



4. 13. Intervalo de confianza para la diferencia de parametros de dos distribuciones de 
Poisson independientes 

El intervalo de confianza para la diferencia de parametros X l —X 2 de dos distribuciones de Poisson 
independientes es: 



(x.-x,) 



a, x 7 

+ -...J— +— 

n l n 2 



5. Contrastes de hipotesis 

5.1. Conceptos generates 

Una hipotesis estadistica es una afirmacion que se hace acerca de una o varias caracterfsticas de una 
poblacion. 

Un contraste de hipotesis es un procedimiento para decidir si una hipotesis se acepta como valida o se 
rechaza. Su finalidad esencial consiste en demostrar o rechazar hipotesis cientfficas, mediante un 
razonamiento inductivo de tipo probabilistico. 

Los metodos de contraste de hipotesis tienen como objetivo comprobar si determinado supuesto referido a 
un parametro poblacional, o a parametros analogos de dos o mas poblaciones, es compatible con la 
evidencia empfrica contenida en la muestra. Los supuestos que se establecen respecto a los parametros se 
llaman hipotesis parametricas. Para cualquier hipotesis parametrica, el contraste se basa en establecer un 
criterio de decision, que depende en cada caso de la naturaleza de la poblacion, de la distribucion de 
probabilidad del estimador de dicho parametro y del control que se desea fijar a priori sobre la probabilidad 
de rechazar la hipotesis contrastada en el caso de ser esta cierta. 

Referente al contraste de hipotesis, se sabe que un problema es investigable cuando existen dos o mas 
soluciones alternativas y se tienen dudas acerca de cual de ellas es la mejor. Esta situacion permite 
formular una o mas hipotesis de trabajo, ya que cada una de ellas destaca la conveniencia de una de las 
soluciones sobre las demas. Si el proposito es comprobar una teoria ella misma sera la hipotesis del 
trabajo, pero es importante destacar que al formular dicha o dichas hipotesis no significa que ya este 
resuelto el problema, al contrario, que la duda impulsa a comprobar la verdad o falsedad de cada una de 
ellas. La decision final partira de las decisiones previas de aceptar o rechazar las hipotesis de trabajo. 
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Ejemplo 1 

Por ejemplo, supongase que debe realizarse un estudio sobre la altura media de los habitantes de cierto 
pueblo de Espana. Antes de tomar una muestra, lo logico es hacer la siguiente suposicion a priori, (hipotesis 

que se desea contrastar y que se denota como H : 

H : la altura media no difiere de la del resto del pais 

Al obtener una muestra de tamano n = S , se podria encontrar ante uno de los siguientes casos: 

caso 1 muestra = {l, 50 , 1, 52 , 1, 48 , 1, 55 , 1, 60 , 1, 49 , 1, 55 , 1, 63} 

caso 2 muestra = {1,65,1,80,1,73,1,52,1,75,1,65,1,75,1,78} 

Intuitivamente, en el caso 1 serfa logico suponer que salvo que la muestra obtenida sobre los habitantes del 
pueblo sea muy poco representativa, la hipotesis H debe ser rechazada. En el caso 2 tal vez no se pueda 

afirmar con rotundidad que la hipotesis H sea cierta, sin embargo no se podrfa descartar y se admitira por 

una cuestion de simplicidad. 

En todo contraste intervienen dos hipotesis. La H Q es aquella que recoge el supuesto de que el parametro 

toma un valor determinado y es la que soporta la carga de la prueba. Es la que se acepta como verdadera, 
la que se pretende rechazar y la que afirma que no existe diferencia entre dos poblaciones, o entre los 

parametros del estudio. La decision de rechazar la H , que en principio se considera cierta, esta en funcion 

de que sea o no compatible con la evidencia empfrica contenida en la muestra. El contraste clasico permite 

controlar a priori la probabilidad de cometer el error de rechazar la 7/ siendo esta cierta; dicha probabilidad 

se llama nivel de significacion del contraste (a) y suele fijarse en el 1 %, 5 % 6 10 %. 

La proposicion contraria a la H Q recibe el nombre de hipotesis alternativa [HA y suele presentar un cierto 

grado de indefinicion: si la hipotesis alternativa se formula simplemente como "la hipotesis nula no es cierta" 
el contraste es bilateral o a dos colas; por el contrario cuando se indica el sentido de la diferencia, el 

contraste es unilateral o a una sola cola. La decision de rechazar o no la H estan al fin y al cabo basado 

en la eleccion de una muestra tomada al azar, y por tanto es posible cometer decisiones erroneas. Los 
errores que se pueden cometer se clasifican como sigue: 

5.1.1. Error de tipo I 

El error de tipo I es el error en que se incurre al rechazar H cuando es cierta. La probabilidad de cometer 

este error es lo que se llama nivel de significacion. Es una costumbre establecida denotarlo siempre con la 
letra a 

a = Pr (rechazar H \ H es cierta) 

= Vr(aceptar H l \ H es cierta) 

5.1.2. Error de tipo II 

El error de tipo II es el error en que se incurre al no rechazar H cuando es falsa. La probabilidad de 
cometer este error se denota con la letra P : 

P = Pr(no rechazar H \ H es falsa) 

^ Pr(no rechazar H \ H x es cierta) 

En ambos casos, se ha producido un juicio erroneo. Para que las reglas de decision sean buenas, deben 
diseharse de modo que minimicen los errores de la decision; y no es una cuestion sencilla, porque para 
cualquier tamano de la muestra, un intento de disminuir un tipo de error suele ir acompahado de un 
crecimiento del otro tipo. En la practica, un tipo de error puede ser mas grave que el otro, y debe alcanzarse 
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un compromiso que disminuya el error mas grave. La unica forma de disminuir ambos a la vez es aumentar 
el tamano de la muestra, lo que no siempre es posible. 

5.1.3. Tipos de contraste y error gamma fatal 

La interpretacion de la pruebas estadfsticas esta condicionada por la construccion de las hipotesis. Se 
pueden formular hipotesis alternativas en una o dos direcciones con relacion a la hipotesis nula. 
Considerese el caso en donde se comparan dos tratamientos. Con un tipo de contraste unilateral se 
establecerfan supuestos de superioridad o inferioridad de un tratamiento con respecto al otro. Por contra en 
una aproximacion bilateral se establecerfan diferencias entre ambos tratamientos, no importa en que 
sentido. 

Considerese una aproximacion bilateral en la comparacion de dos tratamientos S y P : 

• La H establece que la diferencia es cero H Q : S—P—0. 

• La hipotesis alternativa H \ : S — P^O, la diferencia entre ambos tratamientos es diferente de cero. 

La hipotesis alternativa se aceptara tanto si A>B como si B> A . Supongase que la realidad es A>B . 
La variabilidad muestral puede causar una mala jugada. Aun con el empleo de tecnicas de muestreo 
adecuadas, es improbable pero posible que en la muestra resulte que B~»A. La decision sera aceptar la 
hipotesis alternativa jpero precisamente en la direccion erronea, declarando que B<A\ . La probabilidad de 

cometer este error en la decision es el riesgo gamma. Este es muy pequeho pero comparativamente mucho 
mas importante y dramatico. Como siempre nada hara sospechar de la fiabilidad de los resultados y de la 
bondad de la muestra. 

5.1.4. Niveles de significacion 

Se llama nivel de significacion a la maxima probabilidad con la que se esta dispuesto a correr el riesgo de 
cometer un error de tipo I al contrastar una hipotesis. Esta probabilidad, que a menudo se denota por a, 
suele especificar antes de tomar la muestra, de manera que los resultados obtenidos no influyan en su 
eleccion. En la practica, es frecuente un nivel de significacion de 0,05, 0,01 6 0.001, si bien son posibles 
otros valores. Por ejemplo, si se escoge el nivel de significacion 0,05 (6 5 %) al disehar una regla de 
decision, entonces hay unas cinco oportunidades entre 100 de rechazar la hipotesis cuando debiera 
haberse aceptado. Es decir, se tiene un 95 % de confianza de que se ha adoptado la decision correcta. En 
este caso se dice que la hipotesis ha sido rechazada al nivel de significacion 0,05, que significa que tal 
hipotesis tiene una probabilidad 0,05 de ser falsa. El nivel de significacion y el grado de confianza, estan en 
relacion inversa. 

En un contraste de hipotesis (test de hipotesis, contraste de significacion) se decide si cierta hipotesis H 

puede ser rechazada o no a la vista de los datos suministrados por una muestra de la poblacion. El 
procedimiento general consiste en: 

(a) Planificar la H y la H l . La H es el valor hipotetico del parametro que se compara con el resultado 
muestral resulta muy poco probable cuando la hipotesis es cierta. La H \ sera admitida cuando H Q sea 
rechazada. Habitualmente H , es la negacion de H , aunque esto no es necesariamente asf; 

(b) Especificar el nivel de significacion que se va a utilizar. El intervalo de aceptacion (o mas exactamente 
de no rechazo de la H ) se establece fijando el nivel de significacion a, una cantidad suficientemente 

pequeha de modo que la probabilidad de que el estadfstico del contraste tome un valor fuera del mismo 
-region crftica- 

region critica = C = M. ( \T { ,T S \ 

Por ejemplo, el nivel de significacion del 5 % significa que se rechaza H solamente si el resultado 

muestral es tan diferente del valor hipotetico que una diferencia de esa magnitud o mayor, pudiera 
ocurrir aleatoriamente con una probabilidad de 0,05 o menos. El nivel de significacion va a permitir 
separar sucesos que tienen mucha probabilidad de ocurrir de aquellos que la tienen baja: es una forma 
de marcar el error maximo que se esta dispuesto a admitir; 

(c) Definir un estadfstico (de prueba, de contraste) T relacionado con la hipotesis que se desea contrastar. 
El estadfstico de prueba puede ser el estadfstico muestral (el estimador no segado del parametro que 

12 



se prueba) o una version transformada de ese estadfstico muestral. Por ejemplo, para probar el valor 
hipotetico de una media poblacional, se toma la media de una muestra aleatoria de esa distribucion 
normal, entonces es comun que se transforme la media en un valor z el cual, a su vez, sirve como 
estadfstico de prueba; 

(d) Establecer el valor o valores crfticos del estadfstico de prueba. Habiendo especificado la H , el nivel de 

significacion y el estadfstico de prueba que se van a utilizar, se procede a establecer el o los valores 
crfticos del estadfstico de prueba. Puede haber uno o mas de esos valores, dependiendo de si se va a 
realizar una prueba de uno o dos extremos. 

(e) Determinar el valor real del estadfstico de prueba. Por ejemplo, al probar un valor hipotetico de la media 
poblacional, se toma una muestra aleatoria y se determina el valor de la media muestral. Si el valor 
crftico que se establece es un valor de z , entonces se transforma la media muestral en un valor de z . 

(f) Suponiendo que H sea verdadera, calcular un intervalo (de aceptacion de H ,) yT.—T s Jde manera 
que al calcular sobre la muestra T = T el criterio a seguir sea: 

Si T exp e\T j ,T S J => no se rechaza H (^ se rechaza H l ) 



SiT ex ^(T,,T s ) 



se rechaza H y se acepta H l 



(g) Toma de decision, comparando el valor observado del estadfstico muestral con el valor (o valores) 
crfticos del estadfstico de prueba y consecuentemente aceptar o rechazar H .. 









c nncihloc 




decisiones posibles 








lipotesis nula es verdadera 


la hipotesis nula es falsa 




aceptar la hipotesis nula 


se acepta correctamente 


error tipo II 


rechazar la hipotesis nula 


error tipo 1 


se rechaza correctamente 



Tabla I. Consecuencias de las decisiones en pruebas de hipotesis 



5.2. Pruebas de uno y dos extremos (unilaterales y bilaterales, de una y dos colas) 

Cuando se estudian ambos valores estadfsticos es decir, ambos lados de la media se denomina prueba de 
uno y dos extremos o contraste de una y dos colas. No obstante, se estara interesado con frecuencia tan 
solo en valores extremos a un lado de la media (o sea, en uno de los extremos de la distribucion), como 
sucede cuando se contrasta la hipotesis de que un proceso es mejor que otro (que es lo mismo que 
contrastar si un proceso es mejor o peor que otro). Tales contrastes se llaman unilaterales, de un extremo o 
de una cola. En esta situacion, la region crftica es una region situada a un lado de la distribucion, con area 
igual al nivel de significacion. 



Bilateral 



H L : n=e40 




Unilateral 




Unilateral 




H.: u<40 



H,: li>40 



Figura 4. Contrastes unilateral y bilateral. La posicion de la region crftica depende de la hipotesis alternativa. 
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nivel de significacion a 












0,02 




valores criticos de z 


0,05 0,01 


0,005 


tests unilaterales 


-1,28 o 1,28 


-1,645 1,645 


-2,33 o 2,33 


-2,58 o 2,58 


-2,88 o 2,88 


tests bilaterales 


- 1,645 y 1,645 


-1,96 y 1,96 


-2,58 y 2,58 


-2,81 y2,81 


-3,08 y 3,08 



Tabla II. valores crfticos de z para contraste de unos o dos extremos en varios niveles de significacion 



5.3. Curva caracteristica operativa y curva de potencia 

Se ha visto como limitar el error de tipo I eligiendo adecuadamente el nivel de significacion. Es posible evitar 
el riesgo de cometer error de tipo II simplemente no aceptado nunca hipotesis, pero en muchas aplicaciones 
practicas esto es inviable. En tales casos se suele recurrir a curvas de operacion caracterfsticas (OC), 
graficos que muestran las probabilidades de error de tipo II bajo diversas hipotesis. Proporcionan 
indicadores de hasta que punto un test permitira evitar un error de tipo II; es decir, indicara la potencia de un 
test para prevenir decisiones erroneas. Son utiles en el diseho de experimentos porque sugieren entre otras 
cosas al tamaho de muestra a utilizar. 

5.4. Grados de libertad 

Para el calculo de un estadistico, es necesario emplear tanto observaciones de muestra como propiedades 
de ciertos parametros de la poblacion. Si estos parametros son desconocidos, hay que estimarlos a partir de 
la muestra el numero de grados de libertad de un estadfstico, generalmente denotado por v , y definido 
como el numero N de observaciones independientes en la muestra (el tamaho de la muestra) menos el 
numero k de parametros de la poblacion, estimado a partir de observaciones muestrales. Simbolicamente: 

v = N-k. 

5.5. Observaciones 

1. Los errores de tipo I y II no estan relacionados mas que del siguiente modo: cuando a decrece P crece. 

Por tanto no es posible encontrar tests que hagan tan pequehos como se quiera ambos errores 
simultaneamente. De modo que siempre es necesario privilegiar a una de las hipotesis, que no sera 
rechazada, a menos que su falsedad se haga muy evidente. En los contrastes, la hipotesis privilegiada es 

H que solo sera rechazada cuando la evidencia de su falsedad supere el umbral 100(l-a%) . 

2. Al tomar a muy pequeho se tendra que P puede aproximarse a 1 . Lo ideal a la hora de definir un test es 
encontrar un compromiso satisfactorio entre a y P (aunque siempre a favor de H ) 

Se denomina potencia o poder estadistico de un contraste a la cantidad 1~P , es decir: 

potencia del contraste = 1~P = Pvirechazar H | H es falsa) 





no rechazar H 


rechazar H 




correcto 
probabilidad 1-a 


error tipo 1 
probabilidad a 


H Q es cierta 






error tipo II 
probabilidad P 


correcto 
probabilidad 1~P 


H es falsa 



Tabla III. 

3. En el momento de elegir una hipotesis privilegiada se puede, en principio, dudar entre si elegir una dada 
o bien su contraria. Los siguientes criterios son a tener en cuenta en estos casos: 

• Simplicidad cientffica: a la hora de elegir entre dos hipotesis cientfficamente razonables, se tomara 

como H la mas simple; 
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• Las consecuencias de equivocarse: por ejemplo, al juzgar el efecto que puede causar cierto tratamiento 
medico que esta en fase de experimentacion, en principio se ha de tomar como H aquella cuyas 

consecuencias de no rechazarla siendo falsa son menos graves, y como H \ aquella en la que el 
aceptarla siendo falsa trae peores consecuencias. Es decir: 

\H : el paciente empeora o queda igual ante el tratamiento 

}H l : el paciente mejora con el tratamiento 

Ejemplo 2 

Otro ejemplo claro: cuando se acaban de instalar un nuevo ascensor en el edificio y se quiere saber si caera 
o no al vacfo cuando esten personas dentro. Una persona prudente es la que espera a que un numero 
suficiente de vecinos suyos hayan usado el ascensor (muestra aleatoria) y realiza un test del tipo: 

\H : el ascensor se caera 

}H l : el ascensor no se caera 

y solo aceptara la H l para a«0 aunque para ello tenga que ocurrir que P«l, ya que las consecuencias 
del error de tipo I (ir al hospital) son mucho mas graves que las del error del tipo II (subir a pie varios pisos). 

Es decir a la hora de decidirse por una de las dos hipotesis no basta con elegir la mas probable (nadie diria 
"voy a tomar el ascensor pues la probabilidad de que no se caiga es del 60 %"). Hay que elegir siempre la 

hipotesis H a menos que la evidencia a favor de H l sea muy significativa. 

Ejemplo 1. (continuacion) 

Volviendo al ejemplo de la estatura de los habitantes de un pueblo, un estadfstico de contraste adecuado es 
X . Si la hipotesis H fuese cierta se tendrfa que 



X -> N 



V n J 



(Suponiendo, claro esta, que la distribucion de las alturas de los espaholes siga una distribucion normal de 
parametros conocidos, por ejemplo, jV(u, = 1,74 ; a 2 =10 j. Si u, es el verdadero valor de la media en el 

pueblo en estudio, como la varianza de X es pequeha para grandes valores de n , lo logico es pensar que 
si el valor obtenido con la muestra X = x esta muy alejadode u, = l,74 (region critica), entonces: 

• o bien la muestra es muy extraha, si H es cierta (probabilidad a ); o bien 

• la hipotesis H no es cierta. 

Concretamente en el primer caso, donde la muestra es [1, 50, 1,52, 1,48, 1,55, 1,60, 1,49, 1,55, 1,63}, el 
contraste de hipotesis conveniente es: 

\H : \i = n 

[H 1 :\i> \i 

Aquf H 1 no es estrictamente la negacion de H Q . Esto dara lugar a un contraste unilateral, que es aquel en 
los que la region crftica esta formada por un solo intervalo: 

intervalo de no rechazo de H = (I 1 ; , +ooj 

region critica = i—co ,T.\ 

En el segundo caso, donde la muestra es {1,65,1,80,1,73,1,52,1,75,1,65,1,75,1,78} , el contraste de 
hipotesis que deberfa realizarse es: 
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[H, : u, 9t u. 

Aquf sf se puede decir que H l es la negacion de 7/ : se trata de un contraste bilateral, aquel en el que la 
region crftica esta formada por dos intervalos separados: 

intervalo donde no se rechaza la H Q = \T i ,T S \ 

region critica = ( — oo , T. \u\T s , + coJ 

Los ultimos conceptos que van a introducirse son: 

• Hipotesis simple: aquella en la que se especifica un unico valor del parametro. Es el caso de las 
hipotesis nulas en los dos ultimos contrastes mencionados; 

• Hipotesis compuesta: aquella en la que se especifica mas de un posible valor del parametro. Por 
ejemplo, son compuestas las hipotesis alternativas de esos mismos contrastes. 

5.6. El concepto de valor p o grado de signification 

Supongase que, para una muestra dada, un test de hipotesis rechaza la hipotesis nula H a un cierto nivel 

de significacion a . Si se va bajando poco a poco el nivel de significacion (manteniendo los mismos datos) el 

test se va haciendo mas y mas conservador a favor de H , de manera que H se va rechazando "cada 

vez por menor margen" hasta que Mega un momento en que la hipotesis nula se acepta a partir de un 
determinado valor de a = p , y tambien para todos los valores de a menores que el. 

Para una muestra dada, valor p o grado de significacion, de un test, es aquel que viene dado por los datos 

del experimento y es la probabilidad de encontrar una diferencia igual o superior a la hallada cuando la 
hipotesis nula es cierta. El valor p se interpreta como una medida de la evidencia estadfstica que los datos 

aportan a favor de la hipotesis alternativa H x (o en contra de H ): Cuando el valor p es "muy pequeho" 
(por ejemplo, <0,01 ) se considera que hay una fuerte evidencia a favor de H , ya que ha sido necesario 

bajar mucho el nivel de significacion para poder aceptar H . En otras palabras: el valor p indica "el punto 
de division" entre el rechazo y la aceptacion: Si se aplica un test con un nivel mas alto que el valor p se 
rechazarfa H , si el nivel de significacion es mas pequeho, se acepta. Los programas estadfsticos 
informaticos habituales suelen proporcionar el valor p de los diferentes tests. Esta es una informacion muy 
completa ya que el usuario puede conocer el resultado (aceptacion o rechazo de H Q ) para todos los 
posibles valores de a . 

5. 7. Errores comunes en la interpretation del nivel de signification y el valor p 

La investigacion sobre la comprension de los metodos de inferencia muestra la existencia de concepciones 
erroneas ampliamente extendidas, tanto entre los estudiantes universitarios, como entre los cientfficos que 
usan la inferencia estadistica en su trabajo diario. Estas concepciones erroneas se refieren principalmente 
al nivel de significacion a, que se define como la probabilidad de rechazar la hipotesis nula en caso de que 
sea cierta. 

5.7.1. Inferencia y probabilidad condicional 

La interpretacion erronea mas extendida de este concepto consiste en intercambiar los dos terminos de la 
probabilidad condicional, es decir, en interpretar el nivel de significacion como la probabilidad de que la 
hipotesis nula sea cierta si se ha tornado la decision de rechazarla. Por ejemplo: 

• Birnbaum (1982), informo que sus estudiantes encontraban razonable la siguiente definicion: "Un nivel 
de significacion del 5 % indica que, en promedio, 5 de cada 100 veces que se rechace la hipotesis nula 
se estara equivocado" (1 ); 

• Falk (1986) comprobo que la mayoria de sus estudiantes crefan que a era la probabilidad de 
equivocarse al rechazar la hipotesis nula (2); 
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• Vallecillos (1994) planteo las siguientes cuestiones a una muestra de 436 estudiantes universitarios de 
diferentes especialidades que habian estudiado el tema (3-5): 

1. Un nivel de signification del 5 % significa que, en promedio, 5 de cada 100 veces que se rechace la 
hipotesis nula se estara equivocado (verdadero o false-?: justiffquelo). 

2. Un nivel de signification del 5 % significa que, en promedio, 5 de cada 100 veces que la hipotesis 
nula es cierta sera rechazada (verdadero o falso?: justiffquelo). 

En la cuestion 2 se presenta una(correcta) interpretation frecuencial del nivel de signification, mientras 
que en la cuestion 1 se nan intercambiado (incorrectamente) los dos sucesos que definen la 
probabilidad conditional. Sin embargo, solo el 32 % de los estudiantes dio una respuesta correcta a la 
primera cuestion y el 54 % dio una respuesta correcta a la segunda. De 135 estudiantes que justificaron 
su respuesta, el 41 % dio un argumento correcto en los dos ftems. Un error prevalente en todos los 
grupos de estudiantes fue el intercambio de los terminos de la probabilidad conditional, juzgando por 
tanto correcto la primera cuestion y falsa la segunda. Entrevistas a un grupo reducido de estudiantes 
mostro que esta creencia aparecfa en algunos estudiantes que eran capaces de discriminar entre una 
probabilidad conditional y su inversa (6). Otros estudiantes no distingufan las dos probabilidades 
condicionales, es decir, consideraban que ambos ftems eran correctos. 

Ejemplo 3 

Que las probabilidades condicionales con terminos intercambiados no coinciden, en general, se ilustra en la 
tabla IV que se refiere a la election de estadfstica como tema optativo en una escuela. La probabilidad de 
que una chica tomada al azar estudie estadfstica y la probabilidad de que un estudiante de estadfstica sea 
una chica son diferentes: 



Yx{estudie estadistica \ chica) 
Yx{chica | estudie estadistica) 



3 
4 
3 

8 





chicas 


chicos 


total 


estadistica 


300 


500 


800 


no estadistica 


100 


100 


200 


total 


400 


600 


1000 



Tabla IV. Numero de chicos y chicas en un curso de estadistica 

Es importante resaltar que, incluso cuando se fija el nivel de signification a, es decir, la probabilidad de 
rechazar la H (supuesto que es cierta) y se pueda calcular la probabilidad de obtener un valor del 

estadfstico de contraste menorque un valor particular (supuesta H cierta), la probabilidad de que H sea 

cierta una vez sea rechazada y la probabilidad de que H sea cierta una vez que se ha obtenido el valor 

del estadfstico de contraste no pueden conocerse. 

La probabilidad a posteriori de H dado un resultado significativo depende de la probabilidad a priori de 

H , asf como de las probabilidades de obtener un resultado significativo, dadas las H y H l . 

Desafortunadamente estas probabilidades no pueden determinarse. Mas aun, una hipotesis es o cierta o 
falsa y, por tanto, no tiene mucho sentido calcular su probabilidad en un paradigma inferential clasico 
(donde se da una interpretation frecuencial a las probabilidades objetivas). Solo en la inferencia bayesiana 
pueden calcularse las probabilidades a posteriori de la hipotesis, aunque son probabilidades subjetivas, Lo 
mas que se puede hacer, y es usando inferencia bayesiana, es revisar el grado de creencia personal en la 
hipotesis en vista de los resultados. 

5.7.2. Otras interpretaciones erroneas del nivel de significacion y el valor p 

Hay quien piensa que el valor p es la probabilidad de que el resultado se deba al azar. Puede verse 
claramente que esta conception es erronea en el hecho de que incluso si H es cierta (por ejemplo, si no 
hubiera diferencias de rendimiento en el ejemplo 1) un resultado significativo puede ser debido a otros 
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factores, como, por ejemplo, que los estudiantes del grupo experimental trabajasen mas que sus 
companeros al prepararse para la evaluacion. De aquf la importancia del control experimental para intentar 
asegurar que todas las condiciones (excepto el tipo de ensenanza) se mantienen constantes en los dos 
grupos. El valor p es la probabilidad de obtener el resultado particular u otro mas extremo cuando la 
hipotesis nula es cierta y no hay otros factores posibles que influencien el resultado. Lo que se rechaza en 

un contraste de hipotesis es H y, por tanto, no se puede inferir la existencia de una causa particular en un 
experimento a partir de un resultado significative 

Otro error comun es la creencia en la conservacion del valor del nivel de significacion cuando se realizan 
contrastes consecutivos en el mismo conjunto de datos, lo que produce el problema de las comparaciones 
multiples. A veces se aplica un gran numero de pruebas de significacion a un mismo conjunto de datos. El 
significado del nivel de significacion es que, si se llevan a cabo 100 comparaciones sobre el mismo conjunto 
de datos y se usan en todas ellos el nivel de significacion 0,05, habra que esperar que 5 de las 100 pruebas 
sean significativas por puro azar, incluso cuando la hipotesis nula sea cierta, con la consiguiente dificultad 
para interpretar los resultados (Moses, 1992). 

El habitual uso de los niveles de significacion 0,05 y 0,01 es cuestion de convenio y no se justifica por la 
teorfa matematica. Si se considera el contraste de hipotesis como proceso de decision (la vision de Neyman 
y Pearson), debe especificarse el nivel de significacion antes de llevar a cabo el experimento y esta eleccion 
determina el tamaho de las regiones criticas y de aceptacion que llevan a la decision de rechazar o no la 

hipotesis nula. Neyman y Pearson dieron una interpretacion frecuencial a esta probabilidad: Si la H es 

cierta y se repite el experimento muchas veces con probabilidad de error tipo I igual a 0,05 se rechazara la 
hipotesis nula el 5 % de las veces que sea cierta. Inicialmente Fisher (1935) sugirio seleccionar un nivel de 
significacion del 5 %, como convenio para reconocer los resultados significativos en los experimentos. 
Posteriormente, el mismo Fisher (1956) considero que cada investigador debe seleccionar el nivel de 
significacion de acuerdo a las circunstancias, ya que "de hecho ningun investigador mantiene un nivel de 
significacion fijo con el cual rechaza las hipotesis aho tras aho y en todas las circunstancias", sugiriendo que 
se publicara el valor p exacto obtenido en cada experimento particular, lo que de hecho, implica establecer 

el nivel de significacion despues de llevar a cabo el experimento (7). A pesar de estas recomendaciones, la 
literatura de investigacion muestra que los niveles arbitrarios de 0,05, 0,01, 0,001 se usan casi en forma 
universal para todo tipo de problemas. A pesar de que esta practica introduce sesgo de publicacion (8). A 
veces, si la potencia del contraste es baja y el error tipo II es importante, serfa preferible una probabilidad 
mayor de error tipo I. 

A la interpretacion incorrecta del nivel de significacion se une habitualmente una interpretacion incorrecta de 
los resultados significativos, punto tambien de desacuerdos entre Fisher y Neyman y Pearson. Para Fisher 

un resultado significativo implica que los datos proporcionan evidencia en contra de H , mientras que para 

Neyman y Pearson solo establece la frecuencia relativa de veces que se rechazarfa H cierta a la larga 

(error tipo I). Por otro lado, hay que diferenciar entre significacion estadfstica y significacion practica. En el 
ejemplo 1 se obtuvo una diferencia media significativa en puntuaciones entre los dos grupos de 13,32. Sin 
embargo, se podrfa haber obtenido una significacion estadfstica mayor con un efecto experimental menor y 
una muestra de tamaho mayor. La significacion practica implica significacion estadistica mas un efecto 
experimental suficientemente elevado. 

5.8. Los valores p y los intervalos de confianza: ier\ que confiar? 

Dado un contraste bilateral 

\ H o : 6 = o 

con nivel de significacion a, se rechaza la H si 9 no pertenece al intervalo de confianza para 9 con 
nivel de confianza 1 — a . 

La mayorfa de los estadisticos desaconsejan el uso de las pruebas de hipotesis estadfsticas debido a las 
graves deficiencias de estas pruebas y a su dudosa utilidad en comparacion con otros metodos de analisis 
inferencial. Los primeros argumentos en contra del uso de pruebas de hipotesis aparecieron durante la 
primera mitad del siglo pasado con caracter esporadico, pero cuando en 1986 British Medical Journal dio a 
conocer su postura al respecto, el debate en torno a ellas cobra un impetu que ha quedado evidenciado en 
los centenares de articulos posteriores que contrastan las ventajas de los intervalos de confianza con las 
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carencias del valor p (9). Lo cierto es que estas ultimas, raras veces abordadas en la sala de clase, son 

considerables desde el punto de vista de los fines que persigue un investigador. Hoy por hoy se reconoce 
que los intervalos de confianza aventajan a las pruebas de hipotesis como instrumento analftico para 
muchos tipos de investigacion, entre ellos los estudios observacionales y experimentales relacionados con 
las ciencias medicas y sociales, con el resultado de que la mayorfa de las revistas biomedicas alientan a 
sus autores a proporcionar intervalos de confianza en lugar de valores p . Faciles de calcular con los 

paquetes estadfsticos modernos, los valores p ejercen un poderoso atractivo sobre el investigador por la 

exigua reflexion que exigen y la falsa sensacion de seguridad que confieren. Un solo numero encierra la 
clave que determina si los resultados de un estudio han de sumarse a las pruebas a favor o en contra de 
una hipotesis, y el investigador que obtiene resultados significativos suele sentirse satisfecho de haber 
logrado su meta, sin darse cuenta de que no ha conseguido mejorar en modo alguno su comprension del 
fenomeno que estudia. Para entender a fondo esta afirmacion, conviene examinar que es un valor p . 

5.9. Potencia o poder estadistico de un estudio 

5.9.1. Factores que influyen en la potencia o poder estadistico de un estudio 

La potencia o poder estadistico de un estudio depende de diferentes factores, como: 

• El tamano del efecto a detectar, es decir, la magnitud minima de la diferencia o asociacion entre los 
grupos que se considera clfnicamente relevante. Cuanto mayor sea el tamano del efecto que se desea 
detectar, mayor sera la probabilidad de obtener hallazgos significativos y, por lo tanto, mayor sera el 
poder estadistico; 

• La variabilidad de la respuesta estudiada: cuanto mayor sea la variabilidad en la respuesta, mas dificil 
sera detectar diferencias entre los grupos que se comparan y menor sera el poder estadistico de la 
investigacion. De ahi que sea recomendable estudiar grupos lo mas homogeneos posibles; 

• El tamano de la muestra a estudiar: cuanto mayor sea el tamano muestral, mayor sera la potencia 
estadistica de un estudio. Es por ello que en los estudios con muestras muy grandes se detectan como 
significativas diferencias poco relevantes, y en los estudios con muestras menores es mas facil obtener 
resultados falsamente negativos; 

• El nivel de signification estadistica. Si se disminuye el valor de a tambien se disminuye el poder de la 
prueba. Es decir, si se disminuye la probabilidad de cometer un error de tipo I aumenta 
simultaneamente la probabilidad de un error de tipo II, por lo que se trata de encontrar un punto de 

"equilibrio" entre ambas. Habitualmente se trabaja con un nivel de significacion del 95 % (a = 0,05), 

por lo que el equilibrio hay que en encontrarlo finalmente entre el tamano de la muestra que es posible 
estudiar y la potencia requerida para el estudio. 

Los cuatro factores anteriores, junto con el poder estadistico, forman un sistema cerrado. De este modo, 
una vez fijados tres de ellos, el cuarto queda completamente determinado. 

5.9.2. Calculo del poder estadistico de un estudio 

A la hora de disehar una investigacion, es importante determinar si dicho estudio alcanzara una precision 
suficiente. Generalmente, se suele trabajar con una potencia en torno al 80 % o al 90 %. Sin embargo, las 
condiciones en las que se Neva a cabo con frecuencia una investigacion son diferentes de las que se habian 
previsto en un principio. En consecuencia, y a la vista de hallazgos no significativos, es recomendable 
evaluar de nuevo a posteriori su potencia con el fin de discernir si el estudio carece del poder necesario 
para detectar una diferencia relevante o bien si realmente puede no existirtal diferencia. 

En la tabla VI se muestran las formulas necesarias para el calculo del poder estadistico en funcion de la 

naturaleza de la investigacion. Estas formulas permiten obtener un valor z, _ p a partir del cual se puede 

determinar el poder asociado recurriendo a las tablas de la distribucion normal. En la tabla VII se muestra la 

correspondencia entre algunos valores de z l _ p y el poder estadistico asociado. Sin embargo, y aunque 

dichas formulas permitirian analizar la potencia estadistica en diferentes tipos de diseho, puede resultar mas 
sencillo disponer de algun software especifico con el que poder realizar dichos calculos 

Ejemplo 4 

Supongase que se quiere llevar a cabo un ensayo clinico para comparar la efectividad de un nuevo farmaco 
con la de otro estandar en el tratamiento de una determinada enfermedad. Al inicio del estudio, se sabe que 
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la eficacia del tratamiento habitual esta en torno al 40 %, y se espera que con el nuevo farmaco la eficacia 
aumente al menos en un 15 %. El estudio se diseno para que tuviese una potencia del 80 %, asumiendo 
una seguridad del 95 %. Esto implica que son necesarios 173 pacientes en cada uno de los grupos para 
llevar a cabo la investigacion. Tras finalizar el estudio, solo fue posible tratar con cada uno de los farmacos 
a 130 pacientes en cada grupo en lugar de los 173 pacientes estimados inicialmente. Al realizar el analisis 
estadfstico, se objetivo que no hay diferencias significativas en la efectividad de ambos tratamientos. A partir 
de las formulas de la Tabla VI, se puede calcular la potencia final del estudio. Aplicando la formula para el 
calculo del poder estadfstico de comparacion de dos proporciones ante un planteamiento unilateral se 
obtiene: 




p = 0,475 



*i-= 1.645 



'i-p 



\p,-p 2 \4n -z^yjlp^-p) 



|0,44-0,55|Vl30 - 1,654 ^2x0, 475x(l-0, 475) 



^/0,4x(l-0,4) + 0,55x(l-0,55) 



0,467 



A partir de la tabla VII, se puede determinar que un valor de z x „ =0,467 corresponde a una potencia en 

torno al 65-70 %. Utilizando las tablas de la distribucion normal, se sabe que la potencia es del 68 %, es 
decir, el estudio tendrfa un 68 % de posibilidades de detectar una mejora en la eficacia del tratamiento del 
15%. 

Utilizando la formula anterior, podrfa obtenerse un grafico como en el que se muestra en la figura 5, en la 
que, para este ejemplo, se estima la potencia estadfstica del estudio en funcion del tamaho de la muestra 
estudiada y la magnitud del efecto a detectar. Asi, puede concluirse que de haber estudiado 130 pacientes 
por grupo, se obtiene una potencia de solo el 36,6 % para detectar una diferencia minima del 10 %, una 
potencia del 68 % para detectar una diferencia del 15 % y de un 90,2 % para una diferencia del 20 %. Este 
tipo de graficos resulta muy util tanto en la fase de diseno de un estudio como a la hora de valorar a 
posteriori el poder de una investigacion. 

Ejemplo 5 

Supongase que se quiere llevar a cabo un estudio de casos y controles para estudiar la posible asociacion 
entre la presencia de cardiopatfa isquemica y el habito de fumar. De acuerdo con estudios previos, se cree 
que la incidencia de cardiopatia puede ser hasta dos veces mas alta entre los fumadores, y se asume que la 
frecuencia de exposicion entre los controles sera de un 40 %. Debido a ciertas limitaciones, solo es posible 
para el investigador incluir en el estudio a 100 pacientes con cardiopatfa isquemica (casos). Utilizando las 
formulas de la tabla VI, con un planteamiento bilateral y una seguridad del 95 %: 

OR = 2\ QRp 2 2x0,4 

„ - r => P< =t s = ~, ; = 0,5714 

^2=0,4J Fl (\-p 2 ) + OR Pl (l-0,4) + 2x0,4 

P\ + Pi 
p = — — ^ = 0,486 

2 

n = 100 

a = 0,05 ^ z, u/ =1,96 

1 /2 

c = l ^ 
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Zi a = 



Px~p\^cn -z,_ a> /(c + l) />(!-/>) 



jcp 1 (l-Pi) + P 2 i}-Pi) 

|0,5174-0,40|Vl00 - 1,96^/2x0, 486x(l-0, 486) 

^/0,5714x(l-0,5714) + 0,40x(l-0,40) 

= 0,472 

En las tablas de la distribucion normal se obtiene para un valor z x _„ =0,472 una potencia del 68,17 %. 

Con el fin de mejorar la potencia del estudio, los investigadores se plantean reclutar un mayor numero de 
controles que de casos. En la figura 6 se muestra para el ejemplo anterior el poder de la investigacion en 
funcion del numero de casos y controles estudiados. Como se puede observar, la ganancia en la potencia 
disminuye rapidamente, y es practicamente nula cuando la relacion entre el numero de controles y casos es 
4:1. Esto se verifica en cualquier estudio de casos y controles. En particular, para el ejemplo previo, si se 
estudiasen 100 casos y 200 controles se alcanzarfa una potencia del 80,28%. Si se incluyesen 100 casos y 
300 controles, la potencia serfa de un 84,69 %. Con 400 controles la potencia aumentarfa solo a un 86,89 % 
y con 500 a un 88,19 %. Con lo cual claramente es ineficiente el incluir mas de 4 controles por caso ya que 
no se lograrfa un incremento relevante de la potencia estadfstica. 

El analisis adecuado de la potencia estadfstica de una investigacion, que es en definitiva la capacidad que 
tiene el estudio para encontrar diferencias si es que realmente las hay, es un paso fundamental tanto en la 
fase de diseno como en la interpretacion y discusion de sus resultados. A la hora del diseno, por tanto, debe 
establecerse la magnitud minima de la diferencia o asociacion que se considere de relevancia clfnica, asf 
como la potencia estadfstica que se desea para el estudio y, de acuerdo con ello, calcular el tamano de la 
muestra necesaria. Tras realizar el analisis estadfstico, cuando se dice que no existe evidencia de que A 
se asocie con B o sea diferente de B , debera cuestionarse antes de nada si la ausencia de significacion 
estadfstica indica realmente que no existe una diferencia o asociacion clfnicamente relevante, o 
simplemente que no se dispone de suficiente numero de pacientes para obtener hallazgos significativos. 
Tanto si los hallazgos son estadfsticamente significativos como si no lo son, la estimacion de intervalos de 
confianza pueden tambien facilitar la interpretacion de los resultados en terminos de magnitud y relevancia 
clfnica, proporcionando una idea de la precision con la que se ha efectuado al estimacion, de la magnitud y 
de la direccion del efecto. De este modo, los intervalos de confianza permiten tener una idea acerca de la 
potencia estadfstica de un estudio y, por tanto, de la credibilidad de la ausencia de hallazgos significativos. 



resultado de la prueba: asociacion o diferencia 


significativa 


no significativa 


realidad: asociacion o existe 
diferencia: no existe 


no error: 1 — p 


error de tipo II: P 


error de tipo 1: a 


no error: 1 — a 



Tabla V. Posibles conclusiones tras una prueba estadfstica de contraste de hipotesis. a es la probabilidad 
de cometer un error de tipo I; P es la probabilidad de cometer un error de tipo II. 
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comparacion 
de dos 
proporciones 



test unilateral 



test bilateral 



z i-p — 



Pi~ Pi 



Jn -^-apP^-p) 



Pli}-Pl) + Pl^-Pl) 



z l-p — 



Pi~P: 



Jn - z 1 _ % pp(l-p) 



yjPi(l-Pi) + Pz(}-Pz) 



comparacion 
de dos media 



•i-p 



\n d 

2 7 



'l-a 



•1-p 



In d 

2 7 



■i-% 



estimacion 
de un OR en 
estudios de 
casos y 
controles 



Pi 



OR p 2 



{\-p 2 ) + OR p 2 

\Px-Pi\Jnc ~ z i-*yl{ c + l )p{ l ~P) 



Pi = 



OR p 2 



'i-P 



Pi(l-Pi) + Pi( l -Pi) 



m = cxn 



z i-p — 



m — cxn 



(l-p 2 ) + OR p 2 
p x -p 2 \*Jnc - Zl _y 2 ^j(c+l)p(l-p) 



CPl{l~Pl) + Pii^-Pi) 



estimacion 
de un RR 



RRxp 2 



RRxp 2 



Jn-^-a^P^-p) 



'1-p 



^Pl(!-Pl) + Pl^-Pl) 



z l-p 



yfn - z u% ^2p(\-p) 



Pi( 1 ~Pi) + Pi( l -Pi) 



estimacion 

de un 

coeficiente 

de 

correlacion 

lineal 



■i-p 



Jn-3—ln 

V 2 



'l+r^ 



•l-a 



'1-p 



Jn-3—ln 

V 2 



'! + /* 



n 
Pi 



P = 



Tamano muestral. En un estudio de casos y controles, n es el numero de casos 

En un estudio transversal o de cohortes, proporcion de expuestos que desarrollan la enfermedad. 

En un estudio de casos y controles, proporcion de casos expuestos 

En un estudio transversal o de cohortes, proporcion de no expuestos que desarrollan la 

enfermedad. En un estudio de casos y controles, proporcion de controles expuestos 

P1+P2 
2 
Valor mfnimo de la diferencia a detectar entre dos medias 



s Varianza en el grupo control o de referenda 

c Numero de controles por caso 

m En un estudio de casos y controles, numero de controles 

OR Valor aproximado del odds ratio a detectar 

RR Valor aproximado del riesgo relativo a detectar 

r Magnitud del coeficiente de correlacion a detectar 



Tabla VI. Formulas para el calculo del poder estadfstico para diferentes tipos de diseno. 
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1 1 


seguridad 


test unilateral z 1 _ a test bilateral z x ^ 


80% 


0,200 


0,842 


1,282 


85% 


0,150 


1,036 


1,440 


90% 


0,100 


1,282 


1,645 


95% 


0,050 


1,645 


1,960 


97,5 % 


0,025 


1,960 


2,240 


99% 


0,010 


2,326 


2,576 


poder estadistico 


1-P 






qi 


99% 


0,99 


0,01 


2,326 


95% 


0,95 


0,05 


1,645 


90% 


0,90 


0,10 


1,282 


85% 


0,85 


0,15 


1,036 


80% 


0,80 


0,20 


0,842 


75% 


0,75 


0,25 


0,674 


70% 


0,70 


0,30 


0,524 


65% 


0,65 


0,35 


0,385 


60% 


0,60 


0,40 


0,253 


55% 


0,55 


0,45 


0,126 


50% 


0,50 


0,50 


0,000 



Tabla VII. Valores de z, 



■\-% 



y Zj_„ y mas frecuentemente utilizados. 



Poder estadistico en funcion del tamano muestral y la magnitud del efecto 
a detectar. Comparacion de dos proporciones p1 y p2. 



m 
■c 

Q. 




50 100 150 200 250 300 

Numero de casos por grupo 



350 



400 



450 



' p1 =40% p2=50% p1 =40%; p2=55% p1 =40%; p2=60% 



Figura 5. 



500 
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Poder estadistico en funcion del tamano muestral y el niimero de 
controles por caso en un estudio de casos y controles. p2=40%; OR=2 




200 250 300 350 

Numero de casos 

"c=1 — c=2 c=3 — c=4 — c=5 



400 



450 



500 



Figura 6. 
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